Title

6.5 列数据设置为行索引

如果需要将一个DateFrame表格的列数据设置为该表的行索引，则可以使用df.set_index()

函数，可以将单列或者多列设置为行索引。如果是多列设置为行索引，那么自然就是分层索引，结构如下：

df.set_index(keys,drop=True,append=False,inplace=False,verify_inregity=False)

keys :指定要设置为行索引的列，列的表现形式有列名，Series，序列，数组，迭代器。也可以是单列，也可以是多列，如果是多列，则将多列放置在列表

drop :是否需要删除用作新索引的列，也就是设置为行索引后的列数据是否保留，默认是删除不保留。

append :是否将列添加到现有行索引，True为添加，False为完全替换，默认为False;

inplace :是否就地修改DateFrame表格，而不是创建新的DateFrame表格

verify_integity :检查新索引是否存在重复项，设置为False将提高此方法的性能。

import pandas as pd

df=pd.read_excel(r "D:\Pyobject2023\object\测试\素材\测试素材.列索引设置为行索引.xlsx" )

df=df.set_index([ "部门" , #使用列名

df.籍贯.str[ -2 :], #使用Series

df.编号.str[ 3 :], #使用Series

df.编号.str[ 3 :].to_numpy(), #使用数组，不会显示列名

pd.date_range( "2024-3-1","2024-3-5" ), #使用时间序列，不会显示列名

iter(range( 101,106 )) #加iter变成一个迭代器，就可以了

])

print (df)